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摘 要 : 随 着 髓 入 式 密码 设备 的 广泛 应 用 , 侧 信道 分 析 (SCA) 成 为 其 安全 威胁 之 一 。 通 过 对 密码 算法 物理 实现 过 程 中 

的 泄漏 信息 进行 分 析 实 现 密 钥 恢复 ， 进 而 对 密码 算法 实现 的 安全 性 进行 评估 。 多 层 感 知 器 (MLP) 是 一 种 人 工 神 经 网 

络 结构 ， 为 了 精简 用 于 能 量 分 析 的 MLP 网 络 结构 ， 减 少 模型 的 训练 参数 和 训练 时 间 ， 针 对 基于 汉 明 重量 (HWJ 和 基 

了 MLP 神经 网 络 的 模型 进行 了 研究 ， 输 出 类 别 由 256 分 类 分 别 减少 为 9 分 类 和 2 分类。 通过 采集 AES 密码 
算法 运行 过 程 中 的 能 量 曲 线 , 对 所 提出 的 MLP 神经 网 络 进行 训练 和 测试 。 实验 结果 表明 ， 该 模型 在 确保 预测 精度 的 

前 提 下 ， 能 减少 MLP 神经 网 络 84% 的 训练 参数 和 28% 的 训练 时 间 ， 并 减少 了 窗 钥 恢复 阶段 需要 的 能 量 曲 线 数量 ， 

最 少 只 需要 1 条 能 量 曲线 ， 即 可 完成 AES 算法 完整 密 钥 的 恢复 。 实 验 验 证 了 模型 的 有 效 性 ， 使 用 该 模型 可 以 对 分 组 

密码 算法 实现 的 安全 性 进行 分 析 和 评估 。 
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Research on side channel analysis of block cipher algorithm based on MLP neural network 
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250001, China) 


Abstract: With the widespread application of embedded cryptographic equipment, side channel analysis (SCA) has become 


one of its security threats. The key information is recovered by analyzing the leaked information during the physical 
implementation of the cryptographic algorithm. Furthermore, the security of the cryptographic algorithm can be evaluated. 
MLP is an artificial neural network structure. In order to streamline the MLP network structure for energy analysis and reduce 
the training parameters and training time of the model, this paper studied the models based on Hamming weight (HW) and 
bit-based neural networks, and the output categories were reduced from 256 to 9 and 2 respectively. The power trace during 
the operation of the AES cryptographic algorithm was collected through experiments. This paper trained and tested the 


nu proposed MLP neural network. The results show that the model can reduce the training parameters of the MLP neural network 
. by 84% and the training time by 2896, and reduce the number of power traces required during the key recovery phase, while 
ensuring the prediction accuracy. At least only one power trace is needed to complete the recovery of the AES algorithm's 


complete key. The validity of the model is verified by experiments, and the security of the block cipher algorithm can be 
analyzed and evaluated by using the model. 
Key words: side channel analysis; deep learning; multi-layer perceptron (MLP); cryptographic chips; AES 


0 az 漏 信号 对 随机 变量 统计 特性 进行 建 模 ， 用 判别 分 析 的 方法 获 

F 取 目 标 设备 泄漏 信息 中 所 隐藏 的 秘密 信息 。 

嵌入 式 设备 如 智能 卡 、.RFID 射频 标签 和 各 种 物 联网 设备 近年 来 ， 密 码 学 界 探索 了 基于 机 器 学 习 和 深度 学 习 的 密 

在 本 文 的 生活 中 得 到 了 广泛 应 用 ， 这 些 设备 使 用 密码 算法 实 。 码 分 析 新 方法 ， 这 对 加 密 算 法 实现 的 安全 性 造成 了 威胁 。 刘 

现 加 解密 操作 ， 从 而 保护 数据 的 安全 。 但 是 ， 在 密码 算法 的 飚 等 人 器 使 用 支持 向 量 机 (SVMD) 方 法 对 电磁 泄漏 信息 进行 分 

执行 过 程 中 ， 设 备 所 处 理 秘密 信息 会 在 能 量 消耗 山 、 处 理 时 析 ， 从 而 实现 密 钥 的 恢复 。Lerman 等 人 中 通过 实验 验证 了 
间 D、 电 磁 辐 射 9] 等 方面 泄漏 , 泄漏 的 信息 依赖 于 所 处 理 的 数 ”SVM 算法 可 以 对 带 掩 码 防护 的 AES 算法 实现 密 钥 恢复 。 


据 和 执行 的 操作 ， 因 此 可 以 通过 对 泄漏 信息 进行 分 析 来 恢复 作为 机 器 学 习 的 一 个 分 支 ， 深 度 学 习 使 用 深度 神经 网 络 
敏感 信息 。 从 复杂 数据 中 学 习 特 征 ， 并 对 另 一 组 数据 分 析 作 出 决策 ， 具 


侧 信 道 分 析 是 由 Kocher 于 1996 年 首次 提出 的 由， 他 通 。 有 良好 的 特征 提取 和 分 类 功能 ， 已 成 为 当前 的 研究 热点 ， 许 
过 对 时 间 序 列 分 析 进 行 密 钥 恢复 ， 随 后 提出 了 更 强大 和 更 通 多 研究 已 经 证 明了 深度 神经 网 络 在 SCA 中 的 性 能 。 Maghrebi 
用 的 分 析 形 式 凯 , 称 为 差分 能 量 分 析 (DPA)。 后 来 ,Mulder 等 。” 等 人 四 最 早 研究 了 深度 刘 学 习 在 密码 算法 实现 中 的 应 l, KS 
AFE2S AT 2 BTBOR NLHI $025 4) B ODEMA SIRRA JAR A A MLP) A EA S 9928 (CNN) STR BE 55 2] STO JN 
码 算 法 如 ECC 或 RSA 等 。 除 了 简单 和 差分 分 析 分 析 外 ， 模 “于 SCA. 在 文献 [9] 中 ,作者 提出 了 一 种 基于 神经 网 络 的 侧 信 
板 攻击 被 认为 是 最 有 效 的 分 析 方式 ， 它 假设 密码 分 析 者 可 以 EPWA, Xf DPA contest V4 的 带 掩 码 防护 AES 算法 实现 
获得 一 个 相同 的 目标 设备 ， 并 对 目标 设备 完全 可 控 ， 利 用 泄 。 破解 。 文 献 [10] 评 估 卷 积 神经 网 络 (CNN) 的 在 处 理 带 防护 措施 
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录用 定稿 王 ” 恺 ， 等 : 基于 MLP 神经 网 络 的 分 组 密码 算法 能 量 分 析 研究 第 38 卷 第 3 期 
或 未 对 齐 曲 线条 件 下 性 能 。Benadjila 等 人 0 通过 实验 给 出 了 1.3 MLP 神经 网 络 

MLP 模型 的 超 参 数 选择 的 方案 , 进一步 证 明了 深度 学 习 在 模 多 层 感知 器 (Multi-Layer Perceptron, MLP) 是 一 种 由 多 个 
板 型 SCA 中 的 强大 功能 。 感知 器 单元 组 成 的 神经 网 络 025， 如 图 1 所 示 。 每 一 层 的 所 


本 文 对 文献 [11] 中 提出 的 MLP 神经 网 络 模型 结构 进行 了 有 感知 器 与 下 一 层 的 所 有 感知 器 相连 。MLP 由 输入 层 、 输 出 
更 为 深入 的 研究 ， 针 对 模型 参数 较 多 、 各 层 连 接 关系 复杂 和  ” 层 和 一 系列 中 间 层 (隐藏 层 ) 组 成 。 每 一 层 由 一 个 或 多 个 感知 
训练 时 间 较 长 的 缺点 ， 对 模型 的 结构 进行 优化 和 精简 ， 输 出 ” 器 单元 组 成 。MLP 的 权重 值 和 偏差 值 是 随机 梯度 下 降 过 程 中 
层 由 256 分 类 改 为 9 分 类 和 2 分 类 ， 本 文 提 出 了 基于 汉 明 重 更 新 的 可 训练 参数 。 


Æ H] MLP 模型 (HW-MLP) 和 基于 比特 的 MLP 模型 (bit-MLP)。 本 文 主要 研究 多 层 感 知 器 (MLP) 神 经 网 络 ， 它 由 多 个 线 
实验 结果 表明 ， 相 比 于 文献 [11] 中 提出 的 256 分 类 模型 ， 本 ”性 函数 和 非 线性 激活 函数 组 成 的 函数 五 相 联系 ,该 函数 具有 
文 提 出 的 2 种 模型 在 确保 预测 精度 的 前 提 下 , 减少 了 84% 的 ” 计算 效率 高 、 导 数 有 界 且 易 于 求 导 的 特点 。 综 上 所 述 ， 可 以 
训练 参数 和 28% 的 训练 时 间 ， 在 密 钥 恢复 阶段 最 少 只 需要 1 ”将 MLP 表示 为 

条 能 量 曲 线 , 即 可 完成 AES 加 密 算法 密 钥 的 恢复 。 本 文 也 通 F(x)e oA o8, odio oN (x)= y (4) 
过 实验 对 该 模型 的 防护 策略 进行 研究 ， 使 用 该 模型 可 以 有 效 其 中 4 是 全 连接 层 ， 01; 为 激活 函数 ，s 为 Softmax 函数 。 
地 对 分 组 密码 算法 实现 的 安全 性 进行 分 析 和 评估 。 MLP 神经 网 络 是 由 神经 元 形成 一 个 网 格 状 的 结构 , 该 结 

» 41 4 ! 个 连 云 ， 人 个 神经 大 

1 ”密码 算法 能 量 分 析 和 MLP 神经 网 络 cM e " 
1.1 模板 型 能 量 分 析 其 中 w 为 相 邻 层 之 间 神 经 元 连接 权重 值 ，5 为 该 神经 元 的 偏 


模板 型 (Profiled) 能 量 分 析 假 设 如 下 : 假设 对 手 有 两 台 完 BE, /为 激活 函数 , 当前 层 的 神经 元 都 是 上 一 层 中 每 个 相连 
全 相同 的 密码 设备 ， 一 台 建 模 设备 和 一 台 目 标 设备 。 分 析 者 ” ”神经 元 的 输出 值 的 函数 ,常用 的 激活 函数 包括 ReLU、Sigmoid、 
能 够 完全 控制 建 模 设 备 的 输入 和 输出 ， 能 够 通过 技术 手段 非 Tanh 和 Softmax。 
常 精确 地 采集 和 刻画 设备 工作 时 的 能 量 信息 ;目标 设备 运行 MLP 网 络 模型 算法 核心 思想 是 通过 前 向 传播 得 到 误差 ， 
的 是 具有 未 知 密 钥 € K 的 加 密 算法 ， 分 析 的 目标 是 恢复 密 4 把 误差 通过 反 向 传播 实现 权重 值 w 的 修正 ,最 终 得 到 最 优 
钥 字 节 太 。 因 此 模板 型 的 侧 信 道 分 析 分 两 个 阶段 执行 : 建 模 。 模型 。 在 反 向 传播 过 程 中 通常 使 用 随机 梯度 下 降 法 对 权重 值 


E 


阶段 和 分 析 阶 段 ,对 应 于 深度 学 习 中 的 训练 阶段 和 测试 阶段 。 进行 修正 ， 梯 度 下 降 法 的 原理 是 计算 损失 函数 关于 所 有 内 部 
1) 建 模 阶 段 (profiling phase) 变量 的 梯度 ， 并 进行 反 向 传播 。 内 部 变量 通常 是 权重 值 ， 根 
从 建 模 设备 中 采集 能 量 曲 线 ， 使 用 建 模 设备 与 密 钥 相 关 据 损 失 函 数 所 跨越 曲面 的 最 陡 下 降 方向 进行 调整 09。 

泄漏 信息 来 构建 特定 的 泄漏 模型 。 分 析 者 对 每 个 可 能 的 KE li (ARN ji pod SEE 

K, SIRE Y 条 能 量 曲线 PETO, ,构成 训练 集合 or 

X: 


x -Ün () AD 
计算 概率 分 布 函数 上 的 估计 值 er : : 


e -é[r =t |(P,K)=(p-k)] Q) ! | | | J 
Feb 了 表示 所 采集 的 能 量 曲线 数据 集 ， 在 已 知 明文 六 和 密 钥 m 


下 获得 能 量 曲线 rs TER. et 是 从 训练 集 Dy={ts pi ki}, Hil AA ITR MLP 神经 网 络 
i=1,…,Sp 中 计算 出 来 的 。 Fig. 1 MLP neural network with 3 hidden layers 
2) 分 析 阶 段 (Analysis phase) 神经 网 络 是 一 种 计算 开销 非常 大 的 技术 ， 与 传统 分 析 方 
从 目标 设备 采集 能 量 曲线 并 根据 泄漏 信息 进行 分 类 ， 测 X DPA. CPA 相 比 ， 它 需要 花费 更 多 的 时 间 和 内 存 资源 。 但 
W D (ti, pi), i=1,…,S4 用 于 恢复 正确 的 密 钥 ， 最 终 目 标 是 是 ， 它 对 于 侧 信 道 能 量 分 析 具 有 以 下 明显 的 优势 0271; 
通过 能 量 曲 线 的 测试 集 恢复 密 钥 态 ， 概 率 分 布 函 数 估 计 值 ex a) 不 需要 手动 选择 特征 点 , 卷 积 层 和 全 连接 层 通 过 自动 
最 高 值 。 因 此 ， 分 析 者 构建 模型 必须 能 正确 区 分 概率 分 布 函 特征 提取 可 以 识别 和 提取 与 曲线 相关 的 特征 ; 
数 的 估计 值 ee keEK， 实 际 通过 最 大 似 然 函 数 对 估计 值 ex b) 卷 积 层 可 以 独立 于 其 在 数据 中 的 位 置 来 提取 特征 , 因 
进行 计算 ， 对 每 个 可 能 的 猜测 密 钥 k€ K 计算 最 大 似 然 估计 此 深度 神经 网 络 能 够 对 抗 非 稳定 的 时 钟 周期 和 消除 随机 延迟 
L(K): 策略 带 来 的 抖动 ; 
og L[k]= Y logé[(P,K)=(p,k)|T =] 3) c) 由 于 深度 神经 网 络 是 一 个 高 度 参 数 化 的 模型 , 因此 可 
其 中 ，L(&) 是 对 应 于 猜测 密 钥 的 对 数 似 然 概 紊 ， 从 目标 设 以 基于 超 参 数 优化 来 优化 分 类 精度 ， 进 而 提升 侧 信道 分 析 的 
备 中 采集 到 的 能 量 曲 线 使 L(&) 最 大 的 值 对 应 的 keEK 为 正确 成 功率 ; 
的 密 钥 值 。 d) 深度 神经 网 络 可 以 实现 高 度 复 杂 的 功能 , 对 广泛 采用 
1.2 非 模板 型 能 量 分 析 的 防护 策略 (如 掩 码 策略 或 混乱 策略 ) 有 一 定 的 分 析 能 力 。 
非 模 板 型 (Non-Profiled) 能 量 分 析 使 用 统计 分 析 来 检测 泄 1.4 汉 明 重量 模型 


漏 信息 和 敏感 变量 之 间 的 相关 性 。 密 码 算法 能 量 分 析 利 用 了 汉 明 重量 模型 是 计算 寄存 器 在 某 一 时 刻 所 存储 的 数据 1 
这 样 一 个 事实 : 密码 设备 的 瞬时 能 量 消耗 依赖 于 设备 所 处 理 ”个 数 ， 根 据 1 的 个 数 来 刻画 寄存 器 的 能 量 消耗 03。 对 一 个 
的 数据 和 设备 所 执行 的 操作 。 非 模板 型 分 析 方 法 主要 包括 简 位 二 进 制 数据 的 汉 明 重量 模型 的 形式 化 表述 为 

单 能 量 分 析 (Simple Power Analysis, SPA)、 差 分 能 量 分 析 HW(V)= Dr (6) 
(Different Power Analysis, DPA)、 相 关 能 量 分 析 (Correlation 其 中 V=(vr vivo (v= or 1)， 此 模型 通常 用 于 预 充电 模式 的 
Power Analysis, CPA) 等 中 9。 这 种 类 型 的 SCA 对 应 于 假设 较 — 设备 中 能 量 消耗 模型 的 刻画 ， 即 在 数据 变化 之 前 ， 寄 存 器 中 
弱 的 分 析 者 ， 他 们 只 能 访问 在 目标 设备 上 捕获 的 物理 泄漏 ， 所 有 编码 置 为 0 或 1。 
用 于 恢复 密 钥 。 能 量 消耗 模型 是 对 实际 能 量 消耗 的 一 种 模拟 ， 模 拟 精 度 
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录用 定稿 E lë, 等: 基于 MLP 神经 网 络 的 分 组 密码 算法 能 量 分 析 研 究 第 38 卷 第 3 其 
越 高 则 分 析 者 恢复 出 密码 设备 所 使 用 的 敏感 信息 或 密 钥 信息 2.2 Se 
的 能 力 就 越 强 。 汉 明 重 量 模型 可 以 在 分 析 者 对 密码 芯片 的 网 与 传统 的 侧 信道 分 析 方 法 如 DPA、CPA 和 模板 攻击 等 类 
表 一 无 所 知 或 仅 知 道 很 少 一 部 分 的 情况 下 进行 分 析 。 在 汉 明 似 ， XIX EORR RE RON MR, 基于 
重量 模型 中 ， 分 析 者 假设 能 量 消耗 与 被 处 理 的 数据 中 操作 位 MLP 神经 网 络 模型 的 分 析 是 在 有 监督 的 条 件 下 进行 的 , 因此 ， 
的 比特 数 存 在 线性 关系 ， 事 实 上， 数据 的 汉 明 重量 与 处 理 该 训练 阶段 和 测试 阶段 的 曲线 需要 根据 泄漏 模型 选择 相应 的 标 
数据 造成 的 能 量 消耗 并 非 完 全 相关 ,只 限于 一 些 具体 的 场景 。 签 值 ， 根 据 所 选 标签 值 的 不 同 ， 神 经 网 络 最 终 的 分 类 数量 也 
在 AES 算法 的 侧 信道 分 析 过 程 中 , 通常 选取 某 个 S 盒 的 输出 是 不 同 的 。 对 分 组 密码 算法 进行 分 析 时 ， 通 常 选 S 盒 输出 值 
作为 分 析 点 ， 在 该 点 的 输出 值 的 汉 明 重量 通常 与 泄漏 值 成 线 为 分 析 点 ， 该 点 处 的 操作 为 非 线性 变换 ， 能 量 消耗 较 大 ， 对 
性 关系 ， 如 图 2 所 示 ， 能 量 曲线 的 颜色 由 深 到 浅说 明 泄漏 值 于 不 同 数据 区 分 较 明显 。 
HX 8j 8 t 如 果 泄 漏 模 型 是 AES 加 密 算法 第 一 轮 运算 S 盒 输出 值 ， 
如 图 4 所 示 , 在 神经 网 络 输出 值 的 类 别 数 有 以 下 几 种 : 2) 密 
钥 字 节 身 份 模 型 ID 模型 ) 输 出 值 为 23=256 X; b) 汉 明 重量 
模型 (HW 模型 ) 输 出 值 为 9 类 ; c) 单 比特 模型 (bit 模型 ) 输 出 
值 为 0 或 1， 共 2 类。 
明文 密 钥 
4 16 5 : S 8-bit 8-bit 
图 2 S 盒 输出 值 汉 明 重 量 与 电压 值 的 关系 mcm 
Fig.2 The relation between output hamming weight and 
voltage value of S-box Ss& 
8-bit 
2 基于 MLP 神经 网 络 的 能 量 分 析 流 程 和 模型 
ID 模型 | 256 分 类 
2.1 能 量 分 析 流 程 HW 模 型 | 9 分 类 
基于 MLP 神经 网 络 模型 的 能 量 分 析 总 体 流程 如 图 3 所 bit 模 型 | 2 分 类 
示 ， 具 体操 作 步 又 如 下 : 图 4 使 用 S 盒 输出 值 构建 分 析 模型 
数据 采集 ( 预 处 理 ) Fig.4 Use S-box output to build the analysis model 
l 在 本 文 实验 中 ， 使 用 ID 模型 、HW 模型 和 Pbit 模型 用 于 
TT AE MLP 神经 网 络 建 模 ， 本 文 分 别 简称 为 ID-MLP 模型 、HW- 
MLP 模型 和 bit-HW 模型 。 
Sas 上 ”> 2.3 ID-MLP 模型 
不 设计 该 模型 的 目的 是 将 Benadjila 等 人 [90 提出 的 MLP 模 
S 型 引入 到 本 文 的 实验 平台 中 ， 对 其 参数 进行 优化 和 确定 ， 以 
NU 一 达到 最 佳 的 分 析 效 果 ， 并 将 该 模型 作为 参考 模型 与 本 文 提 出 
Vv 的 模型 进行 性 能 对 比 。 
iiia 于 采集 到 的 单条 能 量 曲线 为 时 间 序列 ， 因 此 MLP 神 
图 3 基于 MLP 神经 网 络 的 分 析 流 程 经 网 络 的 输入 层 节 点 数 为 能 量 曲线 的 采样 点 个 数 ， 输 出 层 为 
Fig.3 The analysis process based on MLP neural network 256 个 节点 , 输出 层 使 用 Softmax 激活 函数 ，ID-MLP 模型 共 
a) 数据 采集 和 预 处 理 。 在 传统 的 模板 攻击 和 基于 机 器 学 6 层 。 为 提高 测试 精度 ， 使 用 tanh 激活 函数 ， 模 型 结构 如 表 
习 的 SCA F, 数据 预 处 理 步 又 实际 上 是 狭义 的 降 维 。 通常 采 1 所 示 。 在 训练 过 程 中 ， 标 签 值 为 $ 盒 的 输出 值 ， 共 25=256 
集 到 的 原始 能 量 数据 具有 噪声 大 、 维 度 高 的 特点 ， 需 要 对 数 种 ,因此 在 密 钥 恢复 过 程 中 ,可 以 直接 对 密 钥 字 节 进行 恢复 ， 
据 进行 预 处 理 以 降低 计算 复杂 度 , 因此 预 处 理 过 程 不 能 省 略 。 通过 分 而 治之 的 策略 对 16 个 密 钥 字 节 进 行 恢复 。 
但 是 基于 深度 学 习 的 SCA， 可 以 省 去 降 维 的 预 处 理 步骤 ， 直 表 1 ID-MLP 模型 结构 
接 对 数据 集 进行 预 处 理 。 通 常 将 采集 到 的 能 量 曲线 数据 分 为 Tab. 1 ID-MLP model structure 
训练 数据 集 和 测试 数据 集 两 部 分 ， 训 练 数 据 集 用 于 模型 训练 类 型 节点 数量 《输出 大 小 ”激活 函数 。” ”参数 个 数 
和 建 模 ， 测 试 数据 集 用 于 模型 评价 和 密 钥 恢复 。 输入 层 N 1XN tanh 
b) 模型 训练 。 使 用 训练 数据 对 模型 进行 训练 , 在 训练 过 隐藏 层 Ni 200 1X200 tanh 200X (N+1) 
程 中 通常 采用 交叉 验证 的 方式 对 模型 的 训练 效果 进行 评估 ， 隐藏 层 N， 200 1X200 tanh 40200 
并 且 对 不 同 的 深度 神经 网 络 或 机 器 学 习 算 法 进行 对 比 ， 在 本 隐藏 层 N3 200 1X200 tanh 40200 
文 实验 中 对 支持 向 量 机 算法 (SVM) 进 行 对 比 . 隐藏 层 Na 200 1x200 tanh 40200 
c) 模型 评价 。 通 常 使 用 多 种 评价 策略 来 评价 模型 的 性 能 ， 隐藏 层 Ns 200 1X200 tanh 40200 
或 为 参数 化 模型 选择 最 优 参数 。 在 能 量 分 析 中 主要 评价 指标 输出 层 256 1X256 Softmax 51456 
A: ERRE AA UAR KRH 2.4 HW-MLP 模型 
需要 的 曲线 条 数 、 计 算 资 源 消 耗 等 。 在 实验 中 采用 随机 化 网 格 搜索 法 获取 MLP 结构 的 超 参 
d) 密 钥 恢 复 。 在 密 钥 恢 复 过 程 中 , 通常 采用 “分 而 治之 ” 数 ， 主 要 包括 : 全 连接 层 数 Naye， 隐 藏 层 节点 数 node, I4 
的 策略 ， 对 AES 算法 的 16 个 密 钥 字 节 逐 个 进行 恢复 。 对 于 次 数 epochs, 单 次 训练 数据 量 batch. size, 学 习 率 和 激活 函数 
基于 汉 明 重量 的 模型 ， 可 以 通过 汉 明 重量 的 预测 值 和 已 知 的 类 型 等 。 具 体 结构 设计 如 表 2 Bp. 
明文 数据 ， 计 算出 可 能 的 密 钥 值 ， 通 过 使 用 多 条 曲线 所 对 应 与 ID-MLP 相 比 ，HW-MLP 模型 减少 了 隐藏 层 的 层 数 ， 
的 不 同 汉 明 重量 和 不 同 的 明文 数据 ， 通 过 将 猜测 值 取 交集 的 减少 了 各 隐藏 层 节点 数 ， 增 大 了 学 习 率 ， 并 使 用 tanh 激活 函 
形式 逐步 缩小 密 钥 猜 测 范围 ， 最 终 获 得 子 密 钥 。 数 。 在 各 层 的 结构 设计 上 ， 节 点 数 逐 层 递 减 ， 整 个 网 络 为 倒 
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录用 定稿 


梯形 结构 。 通 过 实验 证 明 该 模型 的 训练 精 
HIRD o 


明显 ， 训 练 时 间 和 训练 参数 大 


£ W, 


K2 HW-MLP 模型 结构 
Tab.2  HW-MLP model structure 


等 : 基于 MLP 神经 网 络 的 分 组 密码 算法 能 量 分 析 研 


度 和 测试 精度 提升 


类 型 节点 数量 《输出 大 小 激活 函数 参数 个 数 
输入 层 N 1XN tanh 
隐藏 层 Ni 200 1X200 tanh 200 Xx (N+1) 
隐藏 层 No 160 1X160 tanh 32160 
隐藏 层 N3 120 1X120 tanh 19320 
隐藏 层 Na 80 1x80 tanh 9680 
输出 层 9 1X9 Softmax 729 
通过 HW-MLP 模型 最 终 可 以 预测 得 到 输入 的 能 量 曲线 
所 对 应 的 汉 明 重量 值 ， 通 过 密 钥 恢复 算法 ， 可 以 使 用 少量 
线 恢复 初始 密 钥 字 节 ， 有 具体 算法 伪 代 码 如 算法 1 所 示 。 该 算 
法 不 局 限于 特定 的 神经 网 络 或 机 器 学 习 算 法 类 型 ， 可 以 用 于 
任意 基于 汉 明 重量 模型 的 模板 型 能 量 分 析 。 
算法 1 通过 HW 值 恢 复 密 钥 字 节 算 法 
输入 : HW value (HWi) 1<i<N, planitexts(pi) 1<i<N. 
输出 : key. 
for i€N do 
for REK do 
Hiiguess-S. box(R & pi) 
if HWguess==HWi do 
set HWguess to the HW set[i] 
HW set[i]-HW set[i] n HW set[i-1] 
if element number of HW set[i]--1 do 
key- HW set[i] 
end for 
return key 
2.5 bit-MLP 模型 
为 了 进一步 精简 网 络 模型 和 训练 参数 ， 使 用 bit 模型 进 


行 建 模 ， 与 HW 模型 相 比 ， 输 吕 
减 小 网 络 层 数 和 节点 个 数 ， 具 


8 结果 为 2 分 类 ， 因 此 进一步 
体 结构 如 表 3 所 示 。 通 过 为 每 


个 密 钥 字 节 建立 8 个 bit 模型 ， 可 以 直接 对 密 钥 比 特 进行 恢 


复 ， 进 而 恢复 完整 密 钥 。 


表 3 bit-MLP 模型 结构 
Tab.3 Bit-MLP model structure 


类 型 节点 数量 ”输出 大 小 ”激活 函数 参数 个 数 
输入 层 N 1XN tanh 

隐藏 层 Ni 

隐藏 层 N2 

200 1X200 tanh 200 x (N+1) 

隐藏 层 N3 

隐藏 层 N4 

隐藏 层 N2 

SMS N2 120 1X120 tanh 24120 
隐藏 层 N3 

隐藏 层 N4 

隐藏 层 Na 

BIRIA Ne 40 1x40 tanh 4840 
隐藏 层 N3 

隐藏 层 N4 

输出 层 2 1X2 Softmax 82 
3 ”实验 与 分 析 
3.1 数据 采集 

为 确保 实验 结果 真实 有 效 ， 本 文 所 有 实验 都 采用 相同 的 
硬件 配置 。 使 用 ChipWhisperer Lite 实验 平台 采集 能 量 曲 线 ， 
ChipWhisperer 是 一 套 完整 的 开源 工具 链 , 主要 用 于 侧 信道 能 


量 分 析 和 故障 注入 。 目 标 芯 片 为 XMEGA128D4 单片机 ， 
标 密码 算法 为 AES， 分 组 长 度 和 密 钥 长 度 均 为 128bit。 通 过 
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， 使 用 随机 明文 和 


ChipWhisperer Lite 采集 60000 条 能 量 | 


Dg 


随机 密 钥 进行 加 密 ， 


条 能 量 曲线 作为 训练 集 ， 


只 中 50000 


10000 条 能 量 | 


线 作为 测试 和 


M 


Yir 
o 


单条 能 量 


线 如 图 5 所 示 , 利用 


LE 4 


AES FORARE, BBÍ 


容易 确定 第 一 轮 运算 9 
状 较为 规则 的 区 域 为 


16 个 S 盒 所 对 应 的 能 量 


NS RH 


右 半 部 分 姑 
线 。 图 6 所 


Ph 16 个 S 盒 的 近似 位 置 ， 


示 为 前 2 个 S AREN 


m He E 


线 放大 之 后 的 图 形 ， 其 中 最 大 值 或 最 


小 值 处 为 其 泄漏 位 置 ， 
应 的 能 量 曲线 包含 72 


通过 观察 和 计算 可 以 确定 单个 S 盒 对 
个 采样 点 , 因此 在 后 续 实验 中 , 单条 


线 样本 输入 大 小 为 1 X72。 


500 1000 500 2000 2500 


gm 
q5 单条 能 量 


| 线 波形 


6 


1440 60 1480 1500 1520 1540 


14 
采样 点 


线 放 大 后 波形 


合 全 县- 
S fx BÉ 


Fig.6 The power trace of S-box is magnified 


3.2 ”实验 评价 指标 


通过 以 下 评价 指标 对 实验 结果 进行 分 析 : 


a) 模型 精度 和 损 
评 佑 的 最 常见 的 指标 ， 


R, 训练 精度 对 应 于 每 个 epoch 


测试 精度 对 应 于 每 个 


练 精度 是 训练 过 程 中 的 一 个 重要 指标 ， 
训练 精度 的 变化 ， 可 以 判 


失 函 数 。 精 度 是 对 神经 网 络 进行 训练 和 
它 被 定义 为 在 数据 集 上 分 类 成 功 的 概 
结束 时 得 出 的 最 大 训练 精度 ， 


epoch 结束 时 得 出 的 最 大 验证 精度 。 训 
通过 观察 每 个 epoch 


断 训 练 的 模型 是 否 满足 神经 网 络 拟 


合 和 泛 化 ， 训 练 精度 的 提高 也 表明 了 反 向 传播 算法 是 否 收敛 


到 正确 的 权重 值 和 偏差 值 。 


来 评估 模型 的 预测 值 


与 真实 值 的 不 一 致 程度 ， 损 失 函 数 越 小 ， 模 型 的 鲁 棒 性 越 好 。 


b) 恢复 密 钥 字 节 
密 钥 字 节 的 曲线 条 数 ， 


线条 数 越 少 ， 模 型 的 性 能 


c) 恢复 完整 密 钥 
钥 字 节 的 
条 数 越 少 ， 


线条 数 ， 对 模型 的 性 能 进行 比较 ， 所 需要 的 
模型 的 性 能 越 好 。 
d) 模型 参数 和 计算 时 间 , 在 


损失 函数 是 


所 需要 的 曲线 条 数 。 通 过 对 比 恢复 单个 


对 模型 的 性 能 进行 比较 ， 所 需要 的 曲 
好 o 
所 需要 的 曲线 条 数 。 通 过 对 比 恢复 全 密 


线 


有 相同 预测 精度 的 前 提 下 ， 


模型 参数 越 少 、 模 型 结构 越 精简 ， 模 型 训练 时 间 花 费时 间 越 


短 ， 性 能 越 好 。 
3.3 ”实验 结果 


1) ID-MLP 模型 实验 
使 用 ID-MLP 模型 对 密 钥 字 节 进行 恢复 ， 以 第 0 字 节 为 


例 进 行 测试 ， 模 型 在 
进行 训练 ， 最 终 训练 


epochs=200、batch_size=100 的 条 件 下 
精度 达到 98.00%， 平 均 测试 精度 达到 


98.89%， 相 比 于 Benadjila-MLP 模型 ， 训 练 精度 提升 明显 ， 


LOSS 值 下 降 较 快 , 恢复 密 钥 所 需要 的 能 量 


所 示 。 


线 更 少 , 如 图 7 


图 7 I 
Fig. 7 
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D-MLP  Benadjila-MLP 模型 训练 精度 与 LOSS 对 比 
Comparison of training accuracy and LOSS between 
ID-MLP and Benadjila-MLP models 


T 


RA 


其 他 密 钥 字 节 的 测试 精度 和 曲线 条 数 如 表 4 所 示 


, 


经 计算 ,平均 训练 精度 达到 97.88% ,平均 测试 精度 为 95.51%， 


恢复 密 钥 字 节 平均 需要 1.050 条 能 量 曲线 。 


表 4 各 8S 盒 实验 数据 和 恢复 密 钥 字 节 需要 的 能 量 曲线 条 数 
Tab.4 Experimental data of each S-box and the number of 


power trace required to recover key bytes 
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图 9 HW-MLP 模型 训练 精度 与 LOSS 
Fig.9 Training accuracy and LOSS of HW-MLP model 
表 5 HW-MLP 模型 与 SVM 算法 对 比 
Tab.5 Comparison betweenhw-MLP model and SVM model 


对 比 内 容 HW-MLP 模型 ”SVM 算法 
训练 时 间 277.4s 449.6s 
训练 精度 98.00% 93.14% 
测试 精度 98.16% 79.19% 
恢复 密 钥 字 节 所 需 曲线 条 数 4.045 5.113 


序号 训练 精度 /% 训练 LOSS/% 测试 精度 /% 线 数量 

S box 00 98.00 740 98.89 1.011 

S box 01 97.70 8.40 96.63 1.035 

S box 02 97.40 9.70 95.69 1.045 

S box 03 97.90 7.60 97.22 1.029 

S box 04 97.50 9.10 90.67 1.103 

S box 05 98.10 6.70 95.96 1.042 

S box 06 97.70 8.00 97.20 1.029 

S box 07 98.30 6.10 94.18 1.062 

S box 08 97.90 740 95.70 1.045 

S box 09 98.40 5.90 97.94 1.021 

S box 10 97.80 7.90 97.62 1.024 

S box 11 98.30 6.40 97.13 .030 

S box 12 97.90 7.60 95.53 .047 

S box 13 98.10 6.60 97.45 .026 

S box 14 97.50 9.40 96.10 041 

S box 15 97.60 8.70 84.26 187 
对 恢复 完整 密 钥 共 进 行 1000 次 实验 ， 所 需要 的 能 量 

线条 数 分 布 柱状 图 如 图 8 所 示 ， 平 均 需 要 1.563 条 曲线 可 完 


成 密 钥 恢复 ， 其 中 有 487 次 实验 仅 需 要 1 条 即 可 完成 恢复 


整 密 钥 。 


对 此 ， 通 过 将 Benadjila-MLP 模型 进行 改进 ， 改 


元 


N 


到 本 文 的 实验 平台 ， 实 验 数据 表明 ， 该 模型 能 达到 较 好 的 预 


测 效果 。 


Fig. 8 


1) HW-MLP 模型 实验 


使 用 


图 8 恢复 128bit 密 钥 线条 数 分 布 


Trace number distribution required to recover 128bit key 


HW-MLP 模型 对 密 钥 字 节 的 汉 明 重量 进行 恢复 ， 


第 0 字 节 密 钥 为 例 进 行 测试 ， 模 型 在 epochs=200 


batch size-100 的 条 件 下 进行 训练 , 随 着 迭代 次 数 的 增加 ， 
练 精度 不 断 提 升 ，LOSS 值 不 断 下 降 ， 最 终 训练 精度 达到 


98.00%， 测 试 精度 达到 97.11%， 如 图 9 所 示 ， 使 用 汉 明 重 
密 钥 恢 复 算法 , 恢复 第 0 字 节 密 钥 平均 需要 曲线 条 数 为 4. 
条 ， 与 SVM 算法 相 比 精度 提升 较为 明显 ， 所 需要 的 能 量 


以 


y 


o 
E 
Qa [HH 


线 更 少 ， 训 练 时 间 也 较 短 ， 如 表 5 所 示 。 


恢复 其 他 密 钥 字 节 的 训练 精度 、LOSS、 测 试 精度 和 曲线 

条 数 如 表 6 所 示 ， 经 计算 ， 平 均 训练 精度 为 97.75%, 平均 测 

试 精度 为 96.13%, 恢复 密 钥 字 节 平均 需要 4.185 条 能 量 曲线 。 
表 6 各 S$S 盒 实验 数据 和 恢复 密 钥 字 节 需 要 的 能 量 曲线 条 数 


Tab.6 Experimental data of each S-box and the number of 


power trace required to recover key bytes 


序号 训练 精度 /% 训练 LOSS/% 测试 精度 /% 曲线 数量 


S box 00 98.00 6.70 97.11 4.045 
S box 01 97.60 7.40 92.48 4.407 
S box 02 97.10 8.60 96.74 4.204 
S box 03 97.90 6.60 96.43 4.237 
S_box_04 97.20 8.60 96.90 4.144 
S_box_05 97.90 6.50 96.60 4.146 
S_box_06 97.60 7.20 96.64 4.172 
S box 07 98.40 5.10 93.02 4.317 
S box 08 97.80 7.00 96.81 4.136 
S box 09 98.30 5.50 96.19 4.135 
S box 10 97.40 7.60 95.65 4.195 
S box 11 98.30 5.40 97.39 4.101 
S box 12 97.60 7.50 96.16 4.192 
S box 13 98.00 6.20 97.08 4.156 
S box 14 97.20 8.80 96.31 4.210 
S box 15 97.70 7.20 96.53 4.158 


使 用 HW-MLP 模型 对 完整 密 钥 进行 恢复 ， 共 进行 1000 
次 实验 ,恢复 完整 密 钥 平均 需要 6.46 条 能 量 曲线 ， 各 条 数 出 
现 的 次 数 如 图 10 所 示 。 


图 10 恢复 128bit 密 钥 需 要 的 曲线 条 数 分 布 
Fig. 10 Trace number distribution required to recover 128bit key 

使 用 HW-MLP 模型 虽然 增加 了 恢复 密 钥 所 需要 的 能 量 
线条 数 ， 但 是 在 由 于 模型 结构 的 简化 ， 训 练 时 间 和 训练 参 
数 都 有 显著 下 降 。 
3.3.1 bit-MLP 模型 实验 

使 用 bit-MLP 模型 对 密 钥 字 节 的 8 bit 进行 恢复 ， 以 

第 0 字 节 密 钥 的 第 0 比特 为 例 进行 实验 ,模型 在 epochs=200、 
batch_size=100 的 条 件 下 进行 训练 ， 最 终 训 练 精度 达到 
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94.56%， 测 试 精度 达到 95.20%， 如 图 11 所 示 。 对 第 0 字 节 3.4 实验 分 析 
密 钥 的 其 他 比特 进行 恢复 ， 结 果 如 表 7 所 示 ， 平 均 训 练 精度 1) 模型 参数 与 性 能 对 比 
为 94.70%， 测 试 精度 为 93.39%， 第 0 字 节 密 钥 恢复 需要 bit-MLP 模型 和 ID-MLP 模型 都 能 使 用 较 少 的 能 量 曲 线 
线条 数 为 1.469 条 。 对 密 钥 进行 恢复 ， 但 是 两 种 模型 的 结构 和 参数 有 较 大 差异 ， 
[7s bit-MLP 模型 结构 简单 ， 训 练 时 间 短 ， 达 到 同样 的 训练 精度 


(>95%6) 所 需要 的 训练 集 数量 更 少 、 时 间 更 短 ,训练 参数 量 比 
BERTA ID-MLP 减少 了 84%， 训 练 时 间 减 少 28%; HW-MLP 模型 的 
Tt 训练 时 间 和 训练 参数 适中 ， 但 是 在 密 钥 恢复 阶段 需要 的 曲线 


Daz Sea E 条 数 较 多 。 最 后 ， 为 每 个 模型 进行 评分 ， 模 型 恢复 完整 密 钥 
n E b E m So b t n 需要 的 曲线 条 数 记 为 N， 模型 参数 个 数 记 为 P， 模 型 的 得 分 
图 11 bit-MLP 模型 4 训练 精度 与 LOSS VF SES V(N*P), 并 将 最 高 值 按 100 分 进行 换算 , 各 模型 对 比 
Fig. 11 Training accuracy and LOSS of bit-MLP model 如 表 9 所 示 。 
表 7 第 0 个 S 盒 8 比特 实验 数据 因此 ， 在 实际 的 能 量 分 析 场 景 中 ， 需 要 综合 考虑 能 量 曲 
Tab.7 8-bitexperimental data of the Oth S-box /% 线 的 输入 维 数 、 信 噪 比 、 采 集 的 曲线 条 数 和 计算 能 力 等 情况 
序号 训练 精度 训练 LOSS 测试 精度 对 模型 进行 改进 ， 选 择 最 佳 模型 以 达到 最 优 性 能 。 
bit 0 94.56 13.70 95.20 表 9 各 模型 参数 与 性 能 对 比 
bit 1 95.23 12.37 95.55 Tab. 9 Comparison of model parameters and performance 
bit 2 93.14 17.10 93.25 内 容 Benadjila-MLP ID-MLP HW-MLP bit-MLP 
bit 3 94.08 15.05 94.22 输出 类 别 256 256 9 2 
bit 4 95.36 12.05 93.35 模型 层 数 6 6 5 4 
bit 5 95.43 11.67 88.40 激活 函数 relu tanh tanh tanh 
bit 6 94.89 13.19 91.85 参数 个 数 270656 270656 76489 43642 
bit 7 94.95 12.82 95.32 单个 epoch 时 间 /s 1.5593 1.3546 1.3869 0.9753 
恢复 其 他 密 钥 字 节 的 训练 精度 、LOSS、 测 试 精度 和 曲线 训练 集 最 少数 量 50000 42000 32000 28000 
条 数 如 表 8 所 示 ， 经 计算 ， 平 均 训 练 精度 为 93.64%， 平 均 测 测试 精度 59.24% 95.51% 96.13% 92.56% 
试 精度 为 92.5696, 恢复 密 钥 字 节 平均 需要 1.540 条 能 量 曲 线 。 恢复 密 钥 字 节 曲 线 数量 1.688 1.050 | 4.185 1.540 
表 8 各 S 盒 实验 数据 和 恢复 密 钥 字 节 需要 的 能 量 曲线 条 数 恢复 完整 密 钥 曲 线 数量 2.700 1.563 6.460 3.837 
Tab.8 Experimental data of each S-box and the number of 得 分 值 27.34 47.23 33.89 100.00 
power trace required to recover key bytes 1) 针对 MLP 模型 的 防护 策略 研究 
序号 ”训练 精度 /% 训练 LOSS/% 测试 精度 /% “曲线 数量 前 针对 分 组 密码 算法 的 防护 主要 有 两 种 策略 ， 一 是 信 
S box 00 94.70 10.80 93.39 1.469 息 隐 藏 技术 ， 主 要 包括 随机 插入 伪 操 作 、 乱 序 操作 、 增 加 噪 
S box 01 94.13 14.72 93.01 1.450 声 等 ， 二 是 掩 码 技术 ， 对 每 个 中 间 值 都 被 称 为 “ 掩 码 ”的 随 
S_box_02 89.86 23.72 89.34 1.812 HAGE HEZ. Mans jg. 36A 5 AUSTR UR IR EK 
S box 03 94.67 1341 93.84 1.421 MARR 2e BEER 6 0377 2e, AA AA E F ft ERE] CPA 
S box 04 89.88 23.73 89.29 1.846 攻击 。 对 ChipWhisperer 实验 平台 进行 随机 插入 伪 操 作 并 采 
S box 05 94.60 13.67 93.81 1.408 集 数据 ， 使 用 bit-MLP 模型 对 第 0 个 S 盒 的 第 0 比特 进行 训 
S box 06 93.66 15.53 91.99 1.539 练 和 测试 , 训练 精度 和 损失 如 图 13 所 示 , 可 以 看 出 插入 伪 操 
S_box_07 96.15 09.96 94.75 1.386 作 后 ， 训 练 精度 上 升 较 慢 ， 最 终 测试 精度 仅 为 64.12%， 略 高 
S box 08 93.23 16.45 92.16 1.502 于 随机 猜测 精度 ， 为 此 该 策略 具有 一 定 的 防御 能 力 。 
S box 09 95.89 10.52 94.87 1.391 ME: 
S box 10 93.29 16.37 92.22 1.577 Je 
S_box_11 95.98 10.37 94.50 1.381 a 
S_box 12 92.54 17.96 92.30 1.549 
S box 13 94.96 12.84 93.86 1.413 H 
S box 14 90.45 22.55 88.70 1.954 和 8 d od d d o 
S box 15 94.26 14.37 92.92 1.535 图 13 插入 伪 随 机 操作 前 后 模型 训练 精度 对 比 
使 用 bit-MLP 模型 对 完整 密 钥 进行 恢复 , 共 进 行 1000 次 Fig. 13 Comparison of training accuracy before and after 


实验 ， 恢 复 完 整 密 钥 平均 需要 3.837 条 能 量 曲线 ， 各 条 数 


inserting pseudo-random operation 


上 上 


4 ARA 


现 的 次 数 如 图 12 所 示 。 
2 将 MLP 神经 网 络 引 入 到 能 量 分 析 中 ， 利 用 MLP 神经 网 
SEMEN o 可 以 挖掘 出 能 量 泄漏 信息 与 所 处 理 的 敏 
: o 感 信息 或 密 钥 数据 的 深层 次 关系 ， 为 能 量 分 析 提 供 了 一 种 新 
的 手段 和 思路 。 实 验 结 果 表 明 ， 通 过 对 文献 [11] 中 的 MLP 模 
Em. 型 进行 改进 ， 将 神经 网 络 结构 进行 优化 ， 在 减少 了 84% 的 训 
练 参数 和 28% 训 练 时 间 的 情况 下 ， 可 以 有 效 提高 测试 精度 ， 
图 12 恢复 128bit 密 负 需要 的 线条 数 分 布 并 减少 密 钥 恢复 阶段 所 需要 的 能 量 曲 线条 数 ， 最 少 仅 需 要 1 
Fig. 12 Trace number distribution required to recover 128bit key 条 曲线 即 可 完成 AES 算法 128 比特 密 钥 的 恢复 。 因 此 ， 本 文 
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提出 的 2 种 模型 具有 训练 参数 较 少 、 训 练 时 间 较 短 的 优点 ， 
随 着 迭代 次 数 的 增加 有 上 共有 较 高 的 预测 精度 和 较 强 鲁 棒 性 ， 该 
模型 也 能 用 于 其 他 分 组 密码 算法 (如 DES、SM4 等 ) 的 侧 信 道 
能 量 分 析 和 评估 场景 。 
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